首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏NewBeeNLP

    我是如何赢得吴恩达首届 Data-centric AI 竞赛的?

    作者 | Johnson Kuan 编辑 | AI科技评论 吴恩达(英文名 Andrew Ng,是人工智能和机器学习领域国际上最权威的学者之一)在今年 6 月的时候宣布首届以数据为中心的人工智能(Data-centric AI)竞赛即将开赛,参赛“作品”的提交日期截止到9月初。 那么,获奖者对赢得吴恩达首届 Data-centric AI 竞赛的心情是怎样的呢?以下是此次竞赛最佳创新奖得主之一 Johnson Kuan 发布的博文,记录了他参赛时的过程以及获奖后的感受。 博文具体内容如下: 在过去的几个月里,我有幸参加了吴恩达首届 Data-centric AI 竞赛。 由 Python 生成的数据评估电子表格示例,用于简化以数据为中心的 AI 工作流程。

    92810发布于 2021-11-19
  • 来自专栏AI科技评论

    GPT 模型成功的背后用到了哪些以数据为中心的人工智能(Data-centric AI)技术?

    GPT系列模型大小比较 2 什么是Data-centric AI? Data-centric AI是一种搭建AI系统的新理念,被@吴恩达老师大力倡导。 Data-centric AI和model-centric AI的区别,图片来源于https://arxiv.org/abs/2301.04819 Data-centric AI框架包括三个目标: 训练数据开发 以下,我们用Data-centric AI框架从三个维度进行分析。 因此,Data-centric AI的研究和开发将持续推动未来AI系统的进步。 大语言模型将为Data-centric AI提供更好的解决方案。 我们对Data-centric AI这个领域进行了总结,希望能帮助大家快速高效地了解这个领域,相关链接见本文开头。鉴于Data-centric AI是一个很大的领域,我们的总结很难面面俱到。

    1.2K10编辑于 2023-04-04
  • 来自专栏鸿的学习笔记

    吴恩达谈 MLOps:调优数据比调优模型更重要

    3月25日,吴恩达开了一个直播讲 A Chat with Andrew on MLOps: From Model-centric to Data-centric AI ,看完后深受启发,便随手写下一些笔记 吴恩达的观点 一个 AI 系统包括了代码和数据两部分,用一个公式表示就是AI System = Code + Data,其中更详细的来说,代码指的模型和算法。 在之前的 AI 系统设计当中,大家似乎更重视对模型的调优这一块,而忽视了对数据的调优,吴恩达认为前者是 Model-centric(以模型为中心),后者是 Data-centric(以数据为中心)。 在之前使用以模型为中心的 AI 系统中,因为重点在模型的选择和参数调整上面,就不太重视数据本身,单纯只是把数据作为 AI 系统的食物(Data is Food for AI)。 ,在这种策略下,可以认为模型是固定的(只对数据集作适应性调整) 缘由 Data-centric 策略和 Model-centric 策略之争在某种程度上是科学家和工程师之争,正如在16年发表的Data-centric

    1.3K40发布于 2021-04-23
  • 来自专栏气象杂货铺

    关注数据而不是模型:我是如何赢得吴恩达首届 Data-centric AI 竞赛的

    如何凭借“数据增强”技术获得吴恩达首届 Data-centric AI 竞赛的最佳创新奖? 作者 | 杏花 编辑 | 青暮 吴恩达(英文名 Andrew Ng,是人工智能和机器学习领域国际上最权威的学者之一)在今年 6 月的时候宣布首届以数据为中心的人工智能(Data-centric AI)竞赛即将开赛 那么,获奖者对赢得吴恩达首届 Data-centric AI 竞赛的心情是怎样的呢?以下是此次竞赛最佳创新奖得主之一 Johnson Kuan 发布的博文,记录了他参赛时的过程以及获奖后的感受。 博文具体内容如下: 在过去的几个月里,我有幸参加了吴恩达首届 Data-centric AI 竞赛。 由 Python 生成的数据评估电子表格示例,用于简化以数据为中心的 AI 工作流程。

    1.1K40编辑于 2022-09-23
  • 来自专栏新智元

    CLUE社区发布国内首个Data-centric竞赛,白给数据分析服务

    正是看到了这种巨大的差别,在吴恩达等人的推动下这种以数据为中心 (Data-centric)的AI进一步的系统化,并成为一个有具有巨大实用价值方法论。 以数据为中心(Data-centric)的AI,是一种新型的AI探索方向。它的核心问题是如何通过系统化的改造你的数据(无论是输入或者标签)来提高最终效果。 它基于CLUE benchmark,结合Data-centricAI的典型特征,进一步将Data-centricAI应用于 NLP领域,融入文本领域的特定并创造性丰富和发展了Data-centricAI。 前80名并超过Data-centric的baseline进入到复赛。

    70020发布于 2021-10-13
  • 来自专栏机器学习初学者精选文章

    【NLP】DataCLUE: 国内首个以数据为中心的AI测评

    DataCLUE 以数据为中心的AI测评(含模型和数据分析报告) DataCLUE: A Chinese Data-centric Language Evaluation Benchmark Github 介绍数据集及示例 贡献与参与 如何参与项目或反馈问题 简介 以数据为中心(Data-centric)的AI,是一种新型的AI探索方向。 正是看到了这种巨大的差别,在吴恩达等人的推动下这种 以数据为中心 (Data-centric)的AI进一步的系统化,并成为一个有具有巨大实用价值方法论。 DataCLUE是一个以数据为中心的AI测评。 它基于CLUE benchmark,结合Data-centricAI的典型特征,进一步将Data-centricAI应用于 NLP领域,融入文本领域的特定并创造性丰富和发展了Data-centric 前80名并超过Data-centric的baseline进入到复赛。

    72820发布于 2021-09-17
  • 来自专栏量子位

    吴恩达新动作:建立全新机器学习资源Hub,「以数据为中心的AI」大本营

    行早 发自 凹非寺 量子位 | 公众号 QbitAI 今天早上,吴恩达教授发推给大家推荐了一个新的资源站:Data-centric AI(DCAI)。 很高兴给大家介绍我们建立的一个新资源站Data-centric AI,这里有许多专家的文章和NeurIPS DCAI研讨会的交流谈话,来看看吧~ 这个DCAI是什么来头? 它代表了最近AI从“以模型为中心”到“以数据为中心”的转变。 在过去几十年间,大多数的AI研究都集中在“code”上面,也就是提升模型或者算法。 大伙纷纷希望加入社区,还有人表示会很快分享自己的成果: 如果有同学对“以数据为中心”的AI内容感兴趣,就赶快用起来吧~ DCAI地址: https://datacentricai.org/ 参考链接:

    47320编辑于 2022-03-04
  • 来自专栏SimpleAI

    数据地图---使用Training Dynamics来映射和诊断数据集

    这其实是Data-centric方向中的data selection要考虑的主要问题之一。 样本贡献也很大,但是里面可能包含很多noise,如果数据错标的话,基本都出现在hard区域 以上就差不多是论文的内容了,其实很简单,但是这样的一个数据地图,其实可以帮助我们进一步观察数据集的特点,帮助我们从data-centric ---- 写作不易 如果觉得有所收获的话 大家就点一个赞吧 :) 2022年的第10/52篇原创笔记 和我一起挖掘有趣的AI研究吧!

    75440编辑于 2022-11-30
  • 来自专栏算法进阶

    机器学习数据工程的概述

    近些年AI大佬吴恩达老师一直在倡导“以数据为中心的AI”(Data-centric Artificial Intelligence,DCAI),以此希望AI研究者重视数据样本的重要性,将目光从以模型为中心转向以数据为中心 Data-centric Artificial Intelligence(DCAI)可以概括为数据工程,主要探索如何高效地构建高质量、大规模的数据集。 而数据工程(或称为Data-centric)的工作经常是脏活累活,对模型的重要性经常被忽视,相关的技术发展也比较少。 Data-centric AI:以数据为中心的人工智能是指一个为人工智能系统开发、迭代和维护数据的框架。以数据为中心的人工智能涉及构建有效训练数据、设计适当的推断数据和维护数据的任务和方法。 :AI领域文章精选!

    8.8K22编辑于 2023-11-17
  • 来自专栏气象杂货铺

    研讨会|机器学习和人工智能在天气和气候模式方面的新机遇(视频和PPT)

    研讨会主要围绕以下三个主题: Views from Domain Science ML/AI Software Technologies High performance, Infrastructure Cambridge) Philosophy and Targeted Applications of ML/AI Techniques for Climate Risk Analytics at Jupiter Rice) Session 2: ML/AI Software technologies Stochastic machine learning for atmospheric fields with 3: High performance, Infrastructure and Big data challenges Scaling Up Deep Learning Workloads - A Data-Centric Simpson (NOAA) Using ML at the Edge to Improve Data Gathering, Pete Warden (Google) An Overview of ML and AI

    48930编辑于 2022-09-23
  • 来自专栏机器之心

    吴恩达近3万人学习的MLOps讲座,官方上线机器之心知识站

    近年来,MLOps 成为了 AI 开发领域的热门概念。 吴恩达老师的这场讲座就围绕这一热门话题展开,演讲主题为《MLOps: From Model-centric to Data-centric AI》。

    32710编辑于 2023-03-29
  • 来自专栏AI算法与图像处理

    论文/代码速递2022.12.8!

    整理:AI算法与图像处理 CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo ECCV2022论文和代码整理 2212.03586 代码/Code: None CVPR2022 NeurIPS Updated on : 8 Dec 2022 total number : 2 MEDIAR: Harmony of Data-Centric

    64520编辑于 2022-12-11
  • 来自专栏ThoughtWorks

    2022 技术雷达峰会 - 首批讲师及话题震撼发布!

    李栋 Thoughtworks 数据智能解决方案架构师 《Data-centric AI: 构建AI系统的基石》企业落地AI有诸多挑战,大多数情况下注意力都集中在算法和模型上,而作为模型训练最为关键的数据往往被忽视 Data-centric AI会从系统化工程的视角,解读如何夯实机器学习应用的基石。

    1.1K10编辑于 2022-05-10
  • 来自专栏云云众生s

    人工智能范式从模型为中心转向数据为中心

    译自 The Paradigm Shift from Model-Centric to Data-Centric AI,作者 Rahul Pradhan 拥有16年以上的经验,目前担任Couchbase 关注以数据为中心的AI,并将模型更接近数据,将改善AI模型的输出,并使企业能够发掘其全部潜力。 以模型为中心的AI方法 以模型为中心的AI方法是机器学习发展的传统方式。 以数据引领AI演进的未来 从以模型为中心向以数据为中心的人工智能(AI)方法转型,代表了一种基本的思维方式的改变。这是将数据置于AI变革之旅的核心。 融合两者的优势 构建强大的AI解决方案需要对何时强调数据和关注模型创新进行细致的理解。平衡运用以模型为中心和以数据为中心AI的优势,对解决当今的AI挑战至关重要,这样组织才能从AI项目中获得最大价值。 为了帮助确保AI模型是在最新的数据上开发的,并且准确可靠,组织必须接受向以数据为中心的AI转型。

    48710编辑于 2024-03-28
  • 来自专栏量子位

    吴恩达:AI是时候从大数据转向「小数据」了

    丰色 编译整理 量子位 | 公众号 QbitAI AI大牛吴恩达不久前刚被检测出新冠阳性,许多网友都向他表达了早日康复的祝愿。 如今,他的工作重心放在了他的Landing AI公司上。 现在当我与大家讨论以数据为中心的人工智能(Data-centric AI)运动时,也会想到15年前与大家讨论深度学习时的场景。这一年,许多人和我说“方向错了”、“两者之间似乎没有什么新东西”。 吴:以数据为中心的AI是为构建成功AI系统所需数据的系统准则。对于AI系统来说,你必须用代码实现一些算法,然后在你的数据集上进行训练。过去十年里,主要的应用范例就是我们下载数据集,同时专注于改进代码。 在NeurIPS会议上,Mary Gray的演讲谈到了以数据为中心的AI是这个问题的解决方案之一(并非全部)。 以数据为中心的AI给我们带来的强大能力之一是构建(engineer)数据子集。 吴:合成数据也是Data-centric AI工具集中的一个重要工具。在NeurIPS研讨会上,Anima Anandkumar做了一次涉及合成数据的精彩演讲。

    51030编辑于 2022-03-04
  • 来自专栏Python进阶之路

    调研图基础模型(Graph Foundation Models)

    Data-Centric 图学习的思考:基础模型的崛起凸显了以数据为核心的人工智能(Data-Centric AI)的潜力和优势。 但由于不同图结构间的“结构关联” 不能像 NLP 中那样转化为统一的 token 表示,或像 CV 中转化为像素表示,因此如何确立和推进 Data-Centric 图学习的概念仍是个开放性问题。

    1.1K00编辑于 2024-05-25
  • 来自专栏SimpleAI

    作为普通NLP科研人员对ChatGPT的一些思考

    个人很明显地感受,在AI领域,阶层的鸿沟在明显拉大,普通研究者和顶级研究机构的思路、话语已经开始差距越来越大,两个群体慢慢地在讨论这两种全完不同的东西了。 然而时间已经荒废,一两年时间,虽然很短,但在AI领域,却已经天翻地覆,曾经研究的东西,已经过时了,我自己都不愿再提起了。 以数据为中心的研究 吴恩达这两年提出的Data-centric AI(DCAI)也给我们提示了一种新的研究范式,把焦点从模型开发,转到数据层面。 在知乎@Trinkle 的回答以及评论区,也提到了Data-centric的概念,ChatGPT之所以可以做的这么优秀,跟它背后高质量的数据有着密不可分的关系。 ---- 最后,让ChatGPT为我们缓解一下焦虑吧: ---- 写作不易 如果觉得有所收获的话 大家就点一个赞吧 :) 2022年的第15/52篇原创笔记 和我一起挖掘有趣的AI研究吧!

    91431编辑于 2023-02-13
  • 来自专栏山行AI

    FinGPT——为金融领域的大模型应用提供了更多的可能

    前言 在ChatGPT引领的AI浪潮下,涌现了一大批优秀的AI应用,AI正在不断地重塑一个又一个行业,今天介绍的这个AI项目是跑进github前三甲的金融领域的代表:FinGPT。 这里引申一篇笔者之前整理的金融领域自动量化交易的AI应用:Qbot——一款可自动量化交易的AI应用 面向开放金融的数据中心化 FinGPT:开源项目[1] 让我们不要期待华尔街将大型语言模型(LLM)或开放 Google[71] 链接 •LLM调查[72]•Awesome GPT-3示例[73] 声明 文章翻译整理自:GitHub - AI4Finance-Foundation/FinGPT: Data-Centric : https://lifearchitect.ai/whats-in-my-ai/ [34] FinRL-Meta Repo: https://github.com/AI4Finance-Foundation /FinGPT: Data-Centric FinGPT.

    4.9K71编辑于 2023-06-26
  • 来自专栏全栈开发工程师

    AI日报 - 2025年3月7日

    中国AI巨头加速机器人领域布局 ▎ 政策追踪 | 中国宣布增加对AI、科学和技术创新的支持 政策红利推动技术商业化 ▎ 技术趋势 | HEADINFER技术实现消费级GPU长上下文推理 算力成本降低,边缘AI应用加速 ▎ 应用创新 | Runway首帧视频风格转换惊艳亮相 生成式AI在视频领域再突破 一、今日热点 (Hot Topic) 1.1 Anthropic预测AI将超越诺贝尔奖得主 ⚡ 数据支撑:其模型在化学推理、医学诊断等领域的准确率已接近人类专家 行业影响: ▸ 加速AI在基础科学研究中的角色转变,可能重构科研范式 ▸ 伦理争议升温,需建立AI科研成果的评估与认证体系 : ▸ 为初创企业提供差异化竞争路径 ▸ 推动轻量化模型在边缘设备部署 深度洞察:与其论文《Data-Centric AI》理论一脉相承 六、工具推荐 (Toolbox) 6.1 LM Studio ▸ 验证了LLMs在复杂策略游戏中的规划能力 ▸ 引发关于AI游戏测试伦理的讨论 每日金句 今日思考:*"AI不会取代人类,但会用AI的人将取代不用AI的人"* 出自:Andrew Ng(吴恩达

    40910编辑于 2025-03-09
  • 来自专栏腾讯云安全的专栏

    在FIT 2019上,我们的这块“盾牌”和“镜子”获奖了

    评委会认为,腾讯云数盾作为一套“以数据为中心的审计和保护 DCAP (Data-Centric Audit and Protection)”方案,能够针对数据生命周期内每个阶段的安全做出及时响应,实现了全流程 1、外网盾通过提供数据库审计,拥有提供 PB 级大数据处理能力、千亿级访问请求审计能力,使用黑白双 AI 引擎分析数据和应用系统的外部访问服务,对互联网开放的应用做好安全防范措施,增强应用安全的保护和监控 2、内网盾通过数据安全代理,收口内部人员对核心数据的访问,同时使用AI对海量日志中的隐秘攻击进行识别,精准迅速的捕捉高危操作,一览无遗的展示内部威胁,同时找到从内部发起的异常数据操作行为如越权操作,蚂蚁搬家偷数据等 2、云端自研 AI 查杀引擎+特征引擎,每日鉴定千万级样本,不断自学习样本训练。

    12.2K20发布于 2018-12-13
领券